- диаграмма рассеяния
-
Полезный способ визуализации
множества двух- или трехмерных данных (совместного распределения двух или трех
переменных). На ней каждому наблюдению соответствует одна точка, по осям
откладываются значения переменных, точки на диаграмме не соединены между собой.
Диаграмма рассеяния обычно выводится
перед вычислением коэффициента линейной корреляции или подгонкой регрессионной
линии.
Примеры.
Чем сильнее точки группируются вдоль
прямой линии, тем сильнее линейная взаимосвязь между двумя переменными (тем
выше корреляция).
Если линия, вдоль которой
группируются точки, идет от левого нижнего угла к правому верхнему, взаимосвязь
между двумя переменными положительная (прямая).
Если линия, вокруг которой
группируются точки, идет от верхнего левого угла к нижнему правому, взаимосвязь
между двумя переменными отрицательная (обратная).
Если точки разбросаны по диаграмме
случайным образом, между двумя переменными нет взаимосвязи (очень низкая или нулевая
корреляция).
Очень низкая или нулевая корреляция
может быть результатом нелинейной связи между переменными. Если существующая
взаимосвязь действительно нелинейна (точки группируются вокруг некоторой, не
прямой, линии), коэффициент корреляции не является хорошей мерой силы этой
взаимосвязи.
Диаграмма рассеяния показывает также
нелинейную взаимосвязь между переменными и наличие или отсутствие выбросов.
Если мы имеем дело с большим
количеством переменных, все возможные диаграммы рассеяния можно представить
одновременно в матрице диаграмм рассеяния.
Словарь социологической статистики. 2004.